MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions

2024腾讯ARCLab文章,提出了MiraData。MiraData是大规模、高质量的视频数据集,具有长视频(平均72.1秒)、高运动强度和详细的结构化字幕(平均318字)。同时引入了MiraBenc...